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基于 MF-R 和 AWS 密 钥 管理 机 制 的 物 联网 健康 监测 大 数据 分 析 系 统 “ 
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(1. 佛山 职业 技术 学 院 , 广东 佛山 528137;2. 华南 理工 大 学 , 广州 510000) 


摘 要 : 带 有 传感器 的 可 穿戴 式 医疗 设备 不 断 生成 大 量 数据 ， 由 于 数据 的 复杂 性 ， 难 以 通过 处 理 和 分 析 大 数据 来 找到 
有 价值 的 决策 信息 。 为 了 解决 这 个 问题 ， 提 出 了 一 种 新 的 物 联网 体系 结构 ， 用 于 存储 和 处 理 医疗 应 用 的 可 扩展 传感器 
数据 (大 数据 )。 所 提出 的 架构 主要 由 两 个 子 架构 组 成 : Meta Fog 重 定向 《MF-R) 架构 和 AWS 密 钥 管理 机 制 。MF-R 
架构 使 用 Apache Pig 和 Apache HBase 等 大 数据 技术 来 收集 和 存储 不 同 传感器 设备 生成 的 传感器 数据 ， 并 利用 卡尔 曼 
滤波 消除 噪声 。AWS 密 钥 管理 机 制 使 用 密 钥 管理 方案 ,目的 是 保护 云 中 的 数据 ,防止 未 经 授权 的 访问 。 当 数据 存储 在 
云 中 时 ， 所 提出 的 系统 能 够 使 用 随机 梯度 下 降 算 法 和 你 辑 回归 来 开发 心脏 病 的 预测 模型 。 仿 真实 验 表明 ， 与 其 他 几 种 
算法 相 比 ， 提 出 的 算法 具有 更 小 的 误差 ， 且 在 吞吐 量 、 准 确 度 等 方面 具有 一 定 的 优越 性 。 

关键 词 : 无 线 传感器 网 络 ; 物 联网 ; 大 数据 ; 卡尔 曼 滤波 ; 云 计算 ; AWS 密 钥 管理 机 制 
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IoT health monitoring big data analysis system based on 
MF-R and AWS key management mechanism 


Zang Yanhui!, Zhao Xuezhang!, Xi Yunjiang? 
(1. Foshan Polytechnic, Foshan Guangdong 528137, China; 2. South China University of Technology, Guangzhou 510641, 
China) 


Abstract: Wearable medical devices with sensor continuously generate enormous data, due to the complexity of the data, it is 
difficult to process and analyze the big data for finding valuable information that can be useful in decision-making. In order to 
overcome this issue, this paper proposed a new architecture for the implementation of IoT to store and process scalable sensor 
data (big data) for health care applications. The proposed architecture consisted of two main sub architectures, namely, Meta 
Fog-Redirection (MF-R) and AWS key management mechanism. MF-R architecture used big data technologies such as Apache 
Pig and Apache HBase for collection and storage of the sensor data generated from different sensor devices and it also used 
kalman filter for removal of noise. AWS key management mechanism used a key management scheme to protect data in the 
cloud and prevent unauthorized access. When data was stored in the cloud, the proposed system could use stochastic gradient 
descent algorithms and logistic regression to develop a predictive model of heart disease. Simulation experiments show that 
compared with other algorithms, the proposed algorithm has smaller error and it has certain advantages in terms of throughput 
and accuracy. 


Key words: Wireless sensor network; Internet of Things; Big data; Kalman filter; Cloud computing; AWS key management 


和 交换 数据 的 网 络 连接 而 成 的 ， 物 联网 的 发 展 使 得 传感器 的 Æ IOT 大 数据 分 析 中 ， 通 常 借助 于 云 计算 品 和 雾 计算 中 以 
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其 存储 外 ， 这 有 助 于 医生 诊断 患者 的 健康 状况 。 在 基于 IOT 的 
"n 医疗 健康 应 用 中 ,“ 大 数据 ”起 着 至 关 重要 的 作用 四。 现代 
物 联网 (Internet of things ，IOT) 中 是 物理 对 象 与 用 于 收 保健 系统 通常 采用 临床 数据 以 增加 在 线 可 用 的 临床 记录 .出 
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TERK Z. 例如 , 使 用 可 穿戴 式 传感器 装置 , 对 患者 进 MOSS, RD M eA 8 zm a ERU. EH 


期 性 的 连续 生理 监测 ,可 以 给 出 生理 运动 和 饮食 习惯 建议 。 员 针对 IOT 医疗 系统 做 出 了 许多 改进 ，Jee 和 Kim 描述 了 


期 间 ， 可 穿戴 式 传感器 将 持续 获取 患者 的 健康 数据 ， 并 将 。 ”大 数据 分 析 
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医疗 系统 改进 方式 ， 以 改善 医疗 系统 ， 选 择 适 
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录用 稿 RH, 
的 治疗 方式 %10。 弗吉尼亚 大 学 开发 了 Alarm-Net 架构 , 用 于 监 me" — 
控 患 者 健康 状况 01。 该 框架 有 三 层 架 构 ， 第 一 层 使 用 BP 1R u 
器 和 BCG (心电图 ) 传感器 监测 患者 的 生理 状况 。 第 二 层 架 构 DA (E) 
用 于 观察 环境 参数 ， 如 灰尘 、 热 量 、 运 动 和 光线 等 。 第 三 层 通 P 
过 使 用 无 线 通信 协议 和 网 络 架构 将 原始 观测 信号 传输 到 目的 地 | 
021。 本 文 提出 了 一 种 新 的 物 联网 体系 结构 来 存储 和 处 理 医 疗 应 — 
用 的 传感器 数据 。 提 出 的 架构 包括 Meta Fog 重 定向 (MF-R) EL E 
架构 和 AWS 密 钥 管理 机 制 两 部 分 。 其 中 ，MF-R 架构 主要 用 于 [| 
收集 和 存储 传感器 数据 ， 并 利用 卡尔 曼 滤 波 消除 噪声 。AWS 密 Wesen puli nosset ciues 
钥 管 理 机 制 使 用 密 钥 管理 方案 以 保护 云 中 的 数据 ， 防 止 未 经 授 Ca o a EMT 
权 的 访问 。 lcm sc m aime 
Es MF-R 和 AWS 密 钢管 理 机 制 的 大 数据 分 析 e pamm 
dá 将 从 雾 计算 中 收集 的 传感器 数据 传输 并 存储 到 数据 库 中 。 
本 文 提出 一 种 新 的 架构 系统 ， 用 于 存储 和 处 理 医疗 保健 应 ”所 提出 的 架构 将 数据 移入 Amazon S3, 通 过 Amazon EMR 访问 。 
用 中 可 扩展 的 传感器 数据 (大 数据 )。 在 图 1 中 ,描绘 了 各 种 设 本 文通 过 应 用 数据 过 滤 来 提高 数据 处 理 效率 ， 卡 尔 曼 滤 波 
备 物体 之 间 的 连接 通信 。 器 (Kalman filter, KF) 用 于 在 提出 的 框架 中 执行 数据 过 滤 [15], KF 
是 一 个 最 优 估计 器 ， 它 可 以 从 感 测 数据 中 去 除 噪声 。 算 法 表示 
从 设备 收集 数据 如 下 所 示 。 它 最 初 假定 当前 状态 上 是 从 先前 状态 f, 发 展 而 来 


传感器 


Aea 
控制 器 3. 本 地 处 理 数据 以 寻 
找 最 优 信息 
n 发 送信 号 给 执 往 器 
传感器 设备 执行 器 传感器 设备 
> 送 数 据 或 通知 到 医 
SKERA 
PDA PC Laptop 
图 1 医疗 物 联网 中 物 与 物 之 间 的 通信 
1.1 MF-R 架构 
所 提出 的 架构 由 三 个 不 同 阶段 组 成 : 数据 收集 阶段 、 数 据 


处 理 传输 阶段 和 大 数据 存储 阶段 。 


a) 数据 收 


OK., ÍH 


集 阶 


于 持续 监测 患者 的 健康 状况 。 因 此 ， 
、 体 温和 血糖 超过 正常 值 时 ， 设 备 通 


段 ， 用 


过 雾 计算 使 用 无 线 网 络 向 医生 发 送 
在 数据 收集 阶段 ， 通 过 雾 计算 收集 的 传感器 数据 与 云 连接 ， 以 
存储 到 数据 库 
b) 在 数据 处 理 


便 传 输 
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有 临床 数据 的 警报 消息 。 


Hn 


He 


传输 阶段 , 所 提出 的 架构 使 用 “s3cmd utility" 


方法 将 临床 数 所 


EC2 来 存储 患者 的 传感器 数 
据 集 在 Amazon EMR 中 不 可 
EC2 实例 的 本 地 磁盘 上 。 因 此 , 必须 把 它 


EMR 在 云 中 提 


c) 通常 情 


的 09。 为 了 解决 这 个 问题 ， 所 提出 的 


EIA Amazon S3 。 医 疗 机 构 使 用 亚马逊 云 中 的 
居 〈 生 理 数据 )。 但 是 ， 此 传感器 数 
,因为 传感器 数据 仅 存 储 在 运行 
转移 到 EMR 。Amazon 
fft Hadoop 服务 来 处 理 大 数据 03。 

况 下 ， 在 Amazon S3 中 存储 大 量 数据 是 不 可 能 
架构 在 数据 存储 阶段 使 用 


Apache Pig 将 大 量 的 传感器 数据 《临床 数据 ) 从 Amazon S3 f£ 


输 到 Apache HBase， 如 图 2 


2 所 示 。 


的 。 当 前 状态 观察 由 及 表示 。 记 ,表示 时 间 处 的 了 的 


而 估计 精度 


Eits 


Gi 表示。 KF 


9 助 于 以 最 小 的 内 存 消耗 进行 处 


KF 原理 
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初始 化 
T, -状态 转换 模型 (应 


到 上 一 状态 f, i) 


O, -观察 模型 
Q, -过 程 噪音 的 协 方差 


R, -观察 噪音 的 协 方差 


T, -控制 输入 模型 (应 
ai (0, Q, ) 


上 一 状态 fit 


到 控制 向 量 V，) 


使 用 


和 新 的 状态 f 


f, 7T, fi t C, +W 


h, — o, f, +t; 
~ (0,R,) 
从 上 一 状态 得 到 的 当前 状态 评估 
评估 的 状态 


fa E T, f, a TOM, 
预测 的 协 方差 
T 
Gi — T,G, y. jT, +Q, 
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录用 稿 RHR, $: 基于 MF-R 和 AWS 密 钥 管理 机 制 的 物 联网 健康 监测 大 数据 分 析 系 统 
4 ”联合 当前 预测 和 当前 观测 方程 1.1.2 大 数据 存储 阶段 
当前 观测 方程 Amazon EMR 提供 了 多 种 方法 将 大 数据 传送 到 集群 中 ， 可 
X =h, — O, fa 以 将 数据 上 传 到 Amazon S3， 然 后 使 用 Amazon EMR 的 内 置 功 
观测 协 方差 方程 能 将 数据 加 载 到 HBase 集群 中 。 所 提出 的 架构 使 用 Apache Pig 
S, 20,G,, OT +R, 将 传感器 数据 从 Amazon S3 传输 到 Web HBase 是 一 个 可 扩 
— 展 的 分 布 式 数据 库 ， 可 以 以 分 布 式 方式 存储 大 量 行 和 列 ， 并 可 
x | 十 日 


供 集 群 中 的 所 有 节点 使 用 ，HBase 遵循 列 式 数据 库存 储 。 
Apache Pig 是 分 析 大 量 数 据 的 一 个 平台 , 将 数据 表示 为 数据 流 。 

通常 ，Amazon EMR 处 理 存 储 在 Amazon S3 或 HDFS 存储 ”Pig Latin 是 一 种 脚本 语言 ， 用 于 ETL (提取 、 转 换 和 加 载 ) 过 
中 的 数据 。 有 必要 为 存储 数据 的 Amazon S3 提供 全 球 唯一 的 名 程 以 及 对 结构 化 、 半 结构 化 或 非 结构 化 数据 的 ad hoc 数据 分 析 。 
称 。 每 个 Amazon S3 都 有 一 个 唯一 的 URL 命名 约束 ， 来 与 其 ”所 提出 的 架构 使 用 ApachePig 将 新 的 增 量 临床 数据 与 以 前 的 数 
R Amazon S3 交互 。 通 常 , 有 多 种 方法 可 将 数据 加 载 到 Amazon —— 据 结合 到 HBase 中 。 


K,= GiaOr Se 


S3 中 。 本 文 所 提出 的 架构 使 用 “s3cmd utility* 方 法 将 数据 移入 1.2 基于 AWS 密 钥 管理 机 制 的 安全 服务 
Amazon S3。S3cmd 负责 上 传 、 检 索 和 管理 云 存储 服务 提供 商 为 了 保证 雾 计算 和 云 计算 之 间 的 安全 服务 ， 在 本 文 提出 的 
的 数据 ， 这 是 一 个 适用 于 S3 批 处 理 脚本 和 自动 备份 的 命令 执 。” ”框架 中 使 用 了 AWS 密 钥 管 理 机 制 和 AWS Cloud Trails AWS 密 
行程 序 。 钥 管 理 机 制 能 够 让 用 户 安全 、 快 捷 的 使 用 加 密 密 铀 。 该 机 制 在 
MetaFog 重 定向 架构 Amazon S3、EBS 等 AWS 服务 中 已 被 广泛 应 用 ; 此 外 ， 该 机 制 
处 理 审计 日 志文 件 ， 以 检查 登录 用 户 的 详细 信息 ， 比 如 他 /她 / AI 还 被 应 用 在 AWS Cloud Trail 中 ， 以 方便 用 户 更 好 的 使 用 密 铀 
oe nr . 管理 服务 ， 同 时 将 用 户 日 志 记 录 下 来 并 将 其 传输 到 Amazon 
1 全 村 Pient id Sii password, AHERE geolocation, Ñ 。 Spmq， 重 定向 体系 结构 如 图 3 所 示 。 所 提出 的 安全 框架 ， 可 防 


者 名 字 patient name， 患 者 住址 patient_address， 系 统 日 期 sysdate; 
2 如 果 有 任何 恶意 用 户 试图 登录 应 用 程序 


止 在 尝试 登录 到 云 应 用 程序 时 发 生 未 经 授权 的 访问 。 


4 插入 更 新 威胁 值 Threat_updated (patient id，password， | 
geolocation, patient name, patient address, sysdate) ; 一 E | 
加 密 后 的 数据 不 同 云 数据 供应 商 
5 返回 -1; 
6 否则 | 数据 密 钥 + | 
应 用 成 AMWS 服 务 a N o AWSA 密 钥 管理 服务 
7 列表 上 从 Meta 数据 存储 云 中 选择 数据 存储 供应 商 名字 、 数 据 范 ARANY 


图 ， 其 中 登录 应 用 程序 的 客户 d=?; I Sonnir 
8 结束 — €Ü i 
1.2.1 雾 计 算 到 云 计算 

9 如 果 数 据 存储 供应 商 名 字 =“Fog_Sever_1” 并 且 数 据 范围 =“ 临 界 ”) En O MN 
10 ”执行 科研 人 员 把 筋 计 算 定义 为 云 计算 的 延伸 。 使 用 筋 计 算 改 善 
ii 转 到 Fog Sever DB 1 的 新 兴 网 络 范例 ， 具 有 较 少 延迟 和 抖动 。 雾 计算 也 被 称 为 雾 网 
12 从 Fog Sever DB 1 中 选择 *， 其 中 登录 应 程序 的 患者 络 ， 用 于 分 配 云 中 计算 资源 和 应 服务 。 雾 计算 的 主要 标 是 

Id=? 提高 可 扩展 性 、 效 率 并 减少 需要 传输 到 云 中 进行 数据 分 析 、 处 
13 ”结束 里 和 存储 的 数据 量 。 在 雾 计算 环境 中 ， 数 据 处 理 总 是 在 移动 设 
14 如 果 数 据 存储 供应 商 名 字 = Fog Sever 2 并且 数据 范围 = 敏感” 备 的 数据 中 心 或 网 关 、 智 能 路 由 器 的 网 络 边缘 进行 。 
15 $7 在 本 文体 系 结构 中 ， 可 穿戴 传感器 设备 将 健康 数据 传输 到 
$ E 雾 服务 器 。 雾 服务 器 采用 近 边 缘 技 术 ， 将 智能 医疗 应 用 中 的 健 
17 Jk Fog Sever DB 2 中 选择 *， 其 中 : 登录 应 用 程序 的 患者 康 监测 设备 连接 起 来 。 边 缘 计算 在 雾 计 算 的 安全 性 、 保 密 性 和 

Id=? i 

p — " 系统 可 靠 性 方面 发 挥 着 至 关 重 要 的 作用 。 近 边缘 技术 的 主要 
18 如 果 数 据 存储 供应 商 名 字 =“Fog_Sever_3” 并 且 数 据 范围 =“ 正 常 ” M PENA nn" 
oo» 标 是 减少 传输 每 一 比特 通过 云 通道 所 需 的 带宽 量 。 雾 计算 遵循 
转 到 ，Fog Sever DB 3 网 络 边缘 技术 ， 因 此 从 可 穿戴 医疗 设备 收集 数据 需要 花费 的 时 
21 从 Fog Sever DB 3 中 选择 *， 其 中 ， 登录 应 用 程序 的 患者 间 更 少 了 。 在 本 文中 ，MetaFog 重 定向 结构 根据 数据 分 类 Chi 
Id=? 感 、 临 界 和 正常 ) 将 健康 数据 重 定向 到 不 同 的 雾 服务 器 。 另外 ， 
22 结束 该 体系 结构 执行 以 下 功能 : 安全 性 和 日 志文 件 处 理 ， 以 防止 来 
接 下 来 使 用 mb 选项 创建 一 个 名 为 clinical-emr 的 新 存储 ， — 自 恶意 用 户 和 未 经 授权 用 户 的 数据 入 侵 。 


使 用 “s3cmd put” 将 传感器 数据 移入 Amazon S3 。 
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1.2.2 把 雾 计算 安全 集成 到 云 计算 IDUN, RAAE gU» Rudd QUO 的 平均 值 可 以 用 
云 计算 安全 由 策略 和 b imd ab S gez ly ied 

计算 相关 的 数据 、 应 用 程序 、 信 息 和 基础 架构 。 在 本 文 所 提出 M i3 

JRR, KEFR 趟 境 时 ， 安 全 性 是 主要 问题 。 所 提 

nudi EXE d 安全 性 是 sitis 2 ”结果 分 析 

出 的 安全 架构 使 用 安全 术语 作为 公 钥 和 私 钥 、 加 密 和 和 解密， 加 

密 身 份 访问 管理 和 PKI 证 书 授权 来 保护 云 中 的 数据 和 应 用 程序 。 把 从 各 种 传感器 设备 收集 而 来 的 数据 分 类 为 敏感 数据 、 临 

1.2.3 逻辑 回归 随机 梯度 下 降 的 MapReduce 实现 界 数据 和 正常 数据 ， 然 后 将 分 类 结果 存储 在 各 种 表格 中 《 表 
所 提出 的 物 联网 数据 监测 系统 使 用 基于 MapReduce 的 随 ” 1~5)。 假 设 患者 的 临床 参数 是 临界 数据 ， 所 有 临界 数据 存储 在 


机 梯度 下 降 与 逻辑 回归 来 开发 预测 模型 。 该 预测 模型 使 用 。 dE 1 中 。 表 2 描述 了 患者 的 个 人 数据 ， 其 中 包括 姓名 、 年 龄 、 

Apache HBase 中 提供 的 数据 。 该 逻辑 回归 使 用 现 有 数据 来 开发 ”性别 和 地 址 ; 表 3 描绘 了 正常 患者 的 数据 ,包括 患者 ID、 性 别 

预测 模型 。 使 用 MapReduce 实现 基于 SGD 的 罗 辑 回归 ， 如 下 和 年 龄 ; 表 4 描述 了 数据 中 心 的 详细 信息 ,包括 数据 中 心 名 称 、 

所 示 ; 位 置 及 其 类 别 临界、 敏感 、 正 常 ); 表 5 描述 了 日 志文 件 ， 并 
Ss noa V -((a eR ben) oer 存储 了 与 入 侵 者 或 未 经 授权 访问 有 关 的 信息 ， 

= 表 1 患者 的 临床 参数 


n 


UA 


为 


`~ 


时 刻 的 权重 ; 12 是 学 习 速率 。 


编号 患者 临床 参数 家 /位 置 详 细 地 址 
输出 OD E R*， 为 (1 十 1) 时 刻 的 权重 。 C101 体温 波士顿 
MAP 算法 T202 心率 亚特兰大 
class MAPPER S301 血糖 新 德里 
method INITIALIZE 2 患者 的 个 人 资料 
siis sa 编号 名 字 性 别 e wE 
double n=0.1; A231 Albert $ 47 那 格 浦 尔 
#key k;value V; D342 David Us 58 班加罗尔 
method MAP(string k ;double V ); C352 Hendry 女 39 纽约 
执行 表 3 正常 患者 的 数据 
(ab) 2 (kv) 编号 性 别 Aii 位 置 
r-rand() number of reducer A231 5 45 HAKAJ 
EmithIntermediate (r; (a;;b, )) ; D342 k 60 MEK 
结束 C352 女 39 韩国 
Reduce 算法 X 4 数据 中 心 
class REDUCE 数据 存储 供应 商 数据 中 心 位 置 数据 范围 患者 编号 
"key k;value V ; 亚马逊 波士顿 临界 C101 
method REDUCE (string k ; double v[L2; …37]) 谷歌 纽约 敏感 C352 
执行 微软 加 拿 大 正常 D342 
"C 表 5 有 关 入 侵 者 的 信息 
编号 地 理 位 置 IP 地 址 期 和 时 间 
*(asb;) ev[E2; sr] wt. C101 美国 10.10.142.107 12-1-2015: 14:23:03 
p? uda -nvF (ke ): T202 ”亚特兰大 12.11.112.108 14-1-2015: 14:23:03 
D342 MKAN 11.10.122.182 12-1-2015: 14:43:08 
d X112 英国 22.11.111.107 22-1-2015: 14:23:05 
返回 (string 大 ; double g^ y N843 印度 12.10.146.162 14-1-2015: 15:23:07 
结束 根据 不 同 临床 参数 值 的 CPU 使 用 情况 对 所 提出 系统 的 性 
nn 个 临床 记录 集合 VV = (a, e R’;b, € R) s 能 进行 分 析 。 通 过 定量 评估 ， 获 得 从 物 联网 传感器 设备 接收 各 
—— i 种 临床 参数 的 时 间 间 隔 。 图 4 表示 从 IoT 传感器 设备 获得 临床 
ee 参数 的 不 同 数据 集 时 ， 各 种 CPU 的 使 用 情况 。 图 5 表示 使 用 
Ame 


Jeh: M=; {E MapReduce 框架 中 ，M 由 映射 器 自 MepReduce 实现 多加 回归 的 性 能 评估 
m 
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. 表 6 训练 数据 和 测试 数据 
训练 样本 验证 样本 
34 Yes (1) No (0) 总 计 Yes (1) No (0) 总 计 
Yes (1) 89 33 122 Yes (1) 36 ll 47 
3 No (0) 25 64 89 No (0) 14 31 45 
表 7 性 能 评估 
96 1 00 1 50 200 250 300 3 50 400 450 L | A iid 本 
人 准确 度 REUS — 特异 度 精度 召回 率 下 均值 
图 4 在 不 同 临床 参数 采样 率 下 的 CPU 使 用 情况 74.39% 78.07% 66.13% 72.95% 79.22% 75.42% 
2 验证 样本 
s 准确 度 灵敏 度 特异 度 精度 召回 率 F 均值 
g^ 73.9296 71.8296 74.2% 76.59% 72.1496 72.9296 
N 把 本 文 算法 的 结果 与 文献 [18~20] 的 算法 的 结果 进行 比较 
-ll ill iil 分 析 , 如 表 8 所 示 。 计 算 每 个 机 器 学 习 算法 的 均 方 误差 (MSE)、 
T A iui 1i 均 方 根 误差 (RMSE)、R 平方 、Q 平方 、 误 差 平方 和 (SSE), 
c 误差 平方 和 总 和 (TSSE)、 平 均 绝对 误差 (MAE )、 平 均 绝 对 误 
图 5 性 能 评估 差 百分比 (MAPE) 和 均 方 差 (MSD )， 部 分 结果 如 图 6 所 示 。 
MSE 是 估计 值 和 测量 值 间 的 差 ， 其 计划 公式 如 下 ， 
本 文 所 提出 的 基于 物 联 网 的 健康 监测 系统 使 用 随机 梯度 下 ja M 
降 算 法 和 逻辑 回归 来 开发 心脏 病 的 预测 模型 。 从 CHDD 据 库 收 MSE- 0» -$) 0 
集 先前 的 临床 记录 和 患者 的 传感器 数据 。 在 此 过 程 中 ， 健 康 监 ”。 其中， 是 观测 次 数 ，y, 是 观测 值 ， 人 是 预测 什 。 
测 系统 通过 云 和 大 数据 技术 ， 使 用 由 身体 传感器 设备 获取 的 当 —Pn—— MÀ 
zn ill ec 70 gl & TR IU [EE E 0 2 EE 
前 传感器 数据 , 枯 测 分 类 表 如 表 6 所 示 . 所 提出 基于 MapReduce o DUE 
的 预测 模型 的 性 能 分 析 如 表 7 所 示 。 所 提出 的 心脏 病 预测 模型 7R (RMSE) 是 MSE KFAR: 
全 已 对 ， SHE 3 2slr 白条 人 3 I| 0 验 i ` ^Y 度 
能 够 对 心脏 病 进行 有 效 的 分 类 ， 训 练 样本 和 验证 样本 的 准确 度 RMSE - /MSE & 
4) 9173 74.39% F 73.9296 。 在 灵敏 度 、 特 异 度 、 精 度 、 召 回 率 
和 下 均值 这 些 指标 的 帮助 下 ， 评 估 预 测 模型 的 性 能 ， 这 些 指标 R 是 数据 与 拟 合 回归 线 接近 度 的 统计 测量 ， R? 的 定义 如 
的 定义 如 下 : 下 : 
真正 (TP Bg RE 
灵敏 度 = 一 一 ( E (1) R TSS (9) 
真正 (TP)+ 假 负 (FN) | 
其 中 ， SSE 是 每 个 观测 值 与 其 组 平均 值 的 误差 平方 之 和 ; 
真 负 (TN) -y e$) 
特异 度 = 2 SSE =} (y, -$) (10) 
[EGE(FP) - XC (TN) 9 z 
SSE 同样 可 以 表示 为 
准确 度 (TP) (TN) SSE - nx MSE (11) 
T^ GPyeerw)erpegw), € TSS 为 所 有 观测 数据 中 , ARIE S FE NRE 
方 之 总 和 。 TSS 公式 如 下 
真正 (7P) a 
精度 = L 4 E E 
"< FUE(TP) e [EGE(FP) i TSS - 2 i - (2) 
n y 1 n y 
IE(TP x — zai 
召回 率 = 一 一 AN id (5) ne 
真正 (TP)+ 假 负 (FN) OOE 
AE, R? 也 被 定义 为 


精度 + 灵敏 度 
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m 
o 


gl nx MSE a] mRMSE "MAE mMAPE E MSD 
z I 13 | 
Dy Nu y) (13) 8 
i-l 4 
6 | 
Q^ 是 MSE 与 响应 变量 Y 的 方差 之 比 。 Q 公式 如 下 : s 
a] 
n A 3 E 
> (y — Ni y 2 
2 - i-l 14 
Q E ( 可 yy s i [1 m m - 
— 457 文献 [18] 算 法 。 本 文 算法 ”文献 [19] 算 法 文献 [20] 算 法 
Re 由 下 式 定 义 ; 图 6 性 能 比较 
吞吐 量 是 根据 在 给 定时 间 段 内 ， 从 物 联 网 传感器 设备 发 送 
Rug as) 。 到 传感器 服务 器 的 数据 量 来 计算 的 。 例 如 ， 如 果 在 10s 内 的 数 
据 传输 量 为 16 个 字 节 ， 则 物 联网 传感器 设备 的 吞吐 量 为 每 秒 
平均 绝对 误差 (MAE) 衡量 测试 样本 中 ， 预 测 与 实际 观测 Va Ma ia di 
"MCN Mn MM MUN L6 个 字 节 。 图 7 显示 了 使 用 四 种 算法 测量 得 到 的 各 种 物 联 网 
司 绝对 差 的 平均 值 ， 其 差异 具有 相同 的 权重 。 m 
EE 健康 监测 设备 的 吞吐 量 ， 由 图 可 知 ， 本 文 算法 的 吞吐 量 相 对 于 
PAS m 
BAS 其 余 算法 总 是 最 大 ， 其 性 能 较 好 。 
1 n 
MAE - — ,一 六 16 
424" $| (16) XE 
SE 4 ER Mur 7 — EROR 4 3.5 * 文献 [18] 算 法 4 
平均 绝对 误差 百分比 (MAPE) 以 百分比 形式 衡量 误差 的 大 ， 文 献 [19] 算 法 p | 
小 。MAPE 被 定义 为 E 文献 [20] 算 法 一 i 
IRo 5| 1 
| hs 1 
MAPE = 一 》 |> x100 qn I 2 & " 
n y LH Ls E 
Kr 
使 用 均 方差 (MSD) 测量 拟 合 时 间 序 列 值 的 精度 。MSD 的 1- 
计算 方法 为 936 100 — 150 — 200 250 300 
j 观察 数量 
ME (8) 图 7 吞吐 量 比较 
表 8 性 能 分 析 
性 能 指标 
不 同 算法 ; 
RMSE MSE SSE TSS R? Q MAE MAPE MSD 
文献 [18] 算 法 0.629 0.175 10.764 13.864 0.307 0.892 0.503 5.395 8.742 
本 文 算法 0.441 0.078 8.424 12.024 0.299 0.705 0.315 2.143 4.257 
文献 [19] 算 法 0.448 0.141 12.984 16.884 0.223 0.786 0.511 4.345 7.241 
文献 [20] 算 法 0.445 0.104 11.267 14.867 0.242 0.757 0.326 4.092 6.844 
mp iioii 灵敏 度 、 准 确 度 和 F-measure 等 性 能 评估 参数 
证 明了 所 提出 的 架构 以 及 预测 模型 的 有 效 性 。 
本 文 提出 了 一 种 新 的 物 联 网 体系 结构 以 处 理 医疗 应 用 中 的 参考 文献 
可 扩展 传感器 数据 。 所 提出 的 架构 主要 由 两 个 子 架 构 组 成 : d m 


Meta Fog 3& E [8] CMF-RO 架构 和 分 组 AWS 密 钥 管 理 机 制 。 MF- 
R 架构 使 用 Apache Pig 和 Apache HBase 等 大 数据 技术 来 收集 
和 存储 不 同 传感器 设备 生成 的 传感器 数据 ， 并 利用 卡尔 曼 滤 波 
消除 噪声 。 AWS 密 钥 管 理 机 种 
该 体系 结构 还 使 / 
Z, 并 使 用 


密 钥 管 理 服务 和 数据 分 类 函数 来 提供 安全 服 
E-F MapReduce 的 预测 模型 来 预测 心脏 病 。 本 文通 


gu 


1 用 于 确保 雾 计算 与 云 计算 的 集成 。 
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